iT邦幫忙

2025 iThome 鐵人賽

DAY 3
1
佛心分享-讓我升級的那些書

菜雞學習 pandas 的 30 日讀書分享系列 第 3

菜雞學習 pandas 的 30 日讀書分享【Day 3】程式庫 (上)

  • 分享至 

  • xImage
  •  

https://ithelp.ithome.com.tw/upload/images/20250801/20168290c3KKbDWBDV.jpg

重要的 Python 程式庫 (上)

主要為不熟悉 Python 資料生態的所使用的程式庫,做一個簡單的介紹。

NumPy

NumPy 是 Numerical Python 的簡稱,它一直是 Python 環境數值計算的重要基石,它為多數的科學應用提供資料結構、演算法以及程式庫結合

NumPy 的重要功能

  • 快速且高效的多維陣列物件 ndarray
  • 提供函式來執行陣列的逐元素計算或陣列間的數學運算
  • 陣列資料組讀出或寫入磁碟
  • 線性代數運算、傅立葉轉換、亂數產生器
  • 提供成熟的 C API,讓 Python extension 與原生的 C 或 C++ 操作 NumPy 的資料結構及使用其計算功能

pandas

pandas 你可以想成是 Python 的 Excel,提供許多高階資料結構和函式,用來快速、簡便、有效地處裡結構化資料及表格資料。

pandas 物件主要使用 DataFrame,它是一種以直欄為主的表格資料結構,裡面有行跟列,另一種物件是 Series,它是一種一維的帶標籤陣列物件。

  • 帶標記軸 (labeled axes) 的資料結構,可自動或明確對齊資料,預防資料未對其導致的錯誤結果,並能夠處理來自不同的來源、使用不同索引系統的資料
  • 整合時間序列功能
  • 用同一個資料結構來處理時間序列或非時間序列資料
  • 靈活的處理缺失資料
  • 流行的資料庫(SQL)提供的合併功能或其他相關操作

DataFrame 這個名稱對於使用 R 語言來進行統計的使用者並不陌生,因為這個物件名稱來自於 R 語言中功能相仿的 data.frame 物件。

pandas 這個名稱來自 panel data,在經濟學中,代表多為結構資料組,pandas 也代表 Python data analysis。

今日的分享就到這囉,我們明天見,掰掰!


上一篇
菜雞學習 pandas 的 30 日讀書分享【Day 2】為什麼
下一篇
菜雞學習 pandas 的 30 日讀書分享【Day 4】程式庫 (下)
系列文
菜雞學習 pandas 的 30 日讀書分享30
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言